AI资讯新闻榜单内容搜索-Llama 3.1

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

7241 点击 2024-08-16 14:49

最近的论文表明，LLM等生成模型可以通过搜索来扩展，并实现非常显著的性能提升。另一个复现实验也发现，让参数量仅8B的Llama 3.1模型搜索100次，即可在Python代码生成任务上达到GPT-4o同等水平。

来自主题: AI技术研报

9823 点击 2024-08-15 16:05

Mamba 架构的大模型又一次向 Transformer 发起了挑战

来自主题: AI资讯

7467 点击 2024-08-13 17:49

TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。

来自主题: AI资讯

8787 点击 2024-08-13 17:07

把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋，你猜怎么着——

来自主题: AI资讯

10379 点击 2024-08-11 17:16

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

8233 点击 2024-08-05 15:25

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

10090 点击 2024-08-02 16:07

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

11509 点击 2024-08-02 14:26

是时候用CPU通用服务器跑千亿参数大模型了！

来自主题: AI资讯

8936 点击 2024-08-01 16:19

最近一段时间开源大模型市场非常热闹，先是苹果开源了70亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源，在多项基准测试中Llama 3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯

8536 点击 2024-08-01 11:26